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摘要 : 【 目的 ] 开发 移动 端的 文献 阅读 系统 , 通过 利用 在 移动 端的 用 户 手势 行为 数据 及 手势 行为 对 应 的 内 容 , d 


据 用 户 兴趣 , 构建 用 户 兴趣 画像 。[ 应 用 背景 】 融合 内 容 与 用 户 行为 的 用 户 画像 构建 系统 能 够 挖掘 用 户 在 阅读 文 
献 时 的 兴趣 ， 并 进行 用 户 画 像 构建 。[ 方法 ] 以 移动 平台 下 的 Web 阅读 系统 为 工具 , 通过 收集 用 户 在 移动 设备 上 
浏览 文献 产生 的 用 户 手 势 行为 ( 单 击 、 双 击 、 滑 动 、 拖 动 、 放 大 /缩小 等 ) 数 据 以 及 与 用 户 手 势 行 为 相对 应 的 文本 
内 容 , 结合 对 应 文本 内 容 的 浏览 时 间 构 建 用 户 模型 。[ 结果 】 用 户 在 使 用 文献 阅读 系统 时 可 以 发 现 自己 在 阅读 文 
献 过 程 中 的 阅读 兴趣 ,进行 用 户 兴趣 画像 构建 。[ 结论 ] 初步 研究 结果 表明 使 用 用 户 手势 行为 可 以 在 一 定 程度 上 


反映 用 户 的 阅读 兴趣 ,并 进行 用 户 建 模 。 该 研究 结论 可 以 提高 市 场 营销 和 个 性 化 推荐 系统 的 效果 。 
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随 着 经 济 社会 的 不 断 发 展 , 移动 设备 越 来 越 成 为 
人 们 日 常生 活 中 不 可 或 缺 的 工具 。 随 着 移动 设备 的 大 
量 普及 与 功能 不 断 完善 人们 原本 只 在 计算 机 中 进行 
的 操作 开始 越 来 越 多 地 转移 到 移动 设备 上 。 计 算 机 上 
的 用 户 行为 已 经 得 到 广泛 的 研究 , 利用 计算 机 上 的 用 
户 行为 数据 能 够 很 好 地 进行 用 户 建 模 ,揭示 用 户 兴 趣 。 
由 于 移动 设备 的 特性 , 用 户 在 使 用 移动 设备 的 过 程 中 
会 产生 不 同 的 手势 行为 。 目 前 , 利用 移动 设备 的 手势 行 
为 进行 用 户 建 模 的 研究 比较 少 。 本 文 旨 在 研究 如 何 使 用 
移动 设备 中 产生 的 用 户 手势 行为 进行 用 户 建 模 。 

当 用 户 在 移动 设备 上 浏览 一 篇 文献 时 , 不 可 避免 
地 需要 在 移动 设备 的 屏幕 上 发 生 手势 行为 ,如 单 击 


(tap), LiBH(swipe up)、 下 滑 (swipe down), m Eizh 
(drag up)、 向 下 拖 动 (drag down)、 放 大 (pinch out), 4 
小 (pinch in) 等 。 由 于 移动 设备 的 使 用 特点 以 及 屏幕 尺 
寸 限 制 ， 当 用 户 在 屏幕 上 执行 单 击 操作 时 , 表示 用 户 
在 点 击 屏 幕 上 的 内 容 ; 当 用 户 在 屏幕 上 执行 下 请 、 上 
滑 操 作 时 ,表示 正在 快速 地 更 换 屏 幕 中 显示 的 内 容 ; 
当 用 户 在 屏幕 中 执行 向 上 拖 动 、 向 下 拖 动 操作 时 , 表 
示 用 户 正 在 缓慢 地 更 换 屏幕 中 显示 的 内 容 ， 即 用 户 正 
在 阅读 屏幕 中 的 内 容 ; 当 用 户 在 屏幕 上 执行 放大 操作 
时 , 表示 用 户 正在 放大 屏幕 中 的 局 部 内 容 ， 以 便 更 加 
清晰 地 阅读 。Guo 等 中 的 研究 表明 移动 触摸 交互 
(Mobile Touch Interaction)， 即 用 户 在 移动 设备 上 的 手 
势 行为 能 够 反映 用 户 是 否 对 其 阅读 的 文章 感 兴趣 ,而 
且 用 户 在 浏览 相关 内 容 的 停留 时 间 能 够 反映 用 户 对 此 
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内 容 的 兴趣 度 。 

本 文 提出 不 同 的 手势 行为 在 反映 用 户 兴趣 方面 具 
有 不 同 的 权重 , 结合 手势 行为 与 手势 行为 对 应 的 内 容 
能 够 揭示 用 户 兴 趣 。 本 文 结合 自然 语言 处 理 技术 Java 
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程 中 , 并 不 一 定 对 文章 的 每 一 段 的 内 容 都 感 兴趣 ， 而 可 
能 只 对 文章 的 某 一 段 或 者 某 几 段 的 内 容 感 兴趣 。 

结合 上 述 研究 ， 本 文 为 不 同 的 手势 行为 都 设 定 一 
定 的 权重 ， 以 此 来 反映 用 户 对 发 生 手势 行为 文本 片段 


Web 技术 以 及 可 视 化 技术 构建 移动 阅读 平台 , 用 户 通 
过 注册 之 后 可 以 在 阅读 平台 中 阅读 相关 文献 。 该 系统 
通过 收集 用 户 在 浏览 文献 过 程 中 发 生 的 手势 行为 数 
i, 利用 用 户 在 浏览 文献 过 程 中 产生 的 pinch. in/out, 
drag, swipe, tap 手势 行为 门 ,， 结合 手势 行为 对 应 的 文 
本 片段 以 及 文本 片段 浏览 时 间 , 发 现 用 户 的 兴趣 并 形 
成 用 户 的 兴趣 云图 。 


2 ”相关 研究 


随 着 网 络 信息 数量 的 快速 膨胀 ,信息 过 载 问题 的 
出 现 ,， 越 来 越 多 的 网 站 开始 思考 如 何不 让 用 户 迷失 在 
言 息 海 洋 中 。 通 过 发 现 用 户 兴 趣 进而 向 用 户 推荐 其 感 
兴趣 的 信息 或 内 容 是 一 个 很 好 的 解决 方法 。 基 于 此 ， 
很 多 学 者 开始 研究 如 何 利 用 用 户 的 相关 信息 来 获取 用 
户 兴趣 进而 实现 个 性 化 推荐 。Joachim 等 中 研究 表明 从 
搜索 页 面 的 点 击 行为 数据 中 能 够 很 好 地 挖掘 出 用 户 的 
兴趣 、 偏 好 信息 。 孙 铁 利 等 外 根据 用 户 在 计算 机 端 Web 
浏览 器 中 的 浏览 行为 建立 用 户 兴 趣 模型 ， 通 过 包括 拖 
动 滚动 条 、 阅 读 时 间 、 保 存 文档 、 添 加 书签 、 打 印 网 
页 、 跟 随 超 链 接 在 内 的 用 户 行为 确定 用 户 对 于 一 个 页 
面 的 兴趣 度 。 赵 银 春 等 中 根据 用 户 浏览 页 面 时 的 内 容 
言 息 和 行为 信息 ,考虑 页 面 的 浏览 时 间 和 翻 页 /拉动 深 
动 条 的 次 数 , 利用 多 元 线性 回归 模型 计算 用 户 对 某 一 
页 面 的 兴趣 度 。Huang 等 四 结合 鼠标 的 点 击 行为 与 鼠 
标 在 搜索 页 面 不 同 区 域 的 移动 从 而 提高 检索 的 效果 。 

上 述 均 是 针对 计算 机 端的 研究 ,用 户 在 计算 机 上 的 
操作 主要 依赖 于 键盘 以 及 鼠标 等 设备 ， 而 在 移动 设备 


兴趣 度 的 大 小 。 通 过 统计 在 文本 片段 上 发 生 的 手势 行 
为 的 种 类 与 对 应 频数 , 结合 文本 片段 的 浏览 时 间 发 现 
用 户 在 该 文本 片段 中 感 兴趣 的 关键 词 与 对 应 的 兴趣 
BE, 进而 计算 用 户 在 浏览 文献 过 程 中 感 兴趣 的 关键 
词 。 最 终 , 结合 用 户 浏览 的 文献 集合 发 现 用 户 的 兴趣 
空间 , 构建 用 户 画像 。 
3 系统 设计 
3.1 设计 思路 

本 文 首先 通过 阅读 平台 收集 的 手势 行为 数据 与 阅 
读 时 间 信 息 确定 用 户 在 浏览 文章 过 程 中 对 不 同文 本 片 
段 的 兴趣 度 ; 其 次 ， 综 合 文章 中 所 有 发 生 手势 行为 的 
文本 片段 确定 用 户 在 浏览 文章 时 感 兴趣 的 关键 词 ; 最 
终结 合用 户 浏览 的 所 有 文章 发 现 用 户 的 兴趣 , 构建 用 
户 模型 并 可 视 化 处 理 。 设 计 思 路 如 图 1 所 示 。 
3.0 ”系统 架构 设计 

根据 上 述 的 设计 思路 , 将 系统 的 架构 分 为 三 层 ， 
如 图 2 所 示 。 

(1) 数据 层 

数据 层 负 责 保存 系统 运行 时 所 需要 的 数据 、 用 户 
在 浏览 文献 过 程 中 产生 的 行为 数据 以 及 用 户 注 册 时 填 
写 的 个 人 信息 。 

(2) 处 理 层 

处 理 层 负责 系统 的 数据 处 理 任务 , 包括 手势 搜 
集 、 中 文 分 词 、 关 键 词 抽 取 、 兴 趣 度 计算 、 画 像 构建 
以 及 数据 可 视 化 任务 。 通 过 手势 搜集 将 用 户 在 浏览 文 
献 过 程 中 发 生 的 手势 行为 数据 存 人 数据 库 中 ; 利用 中 


中 用 户主 要 依 徘 手 指 在 触摸 屏 上 不 同 的 手势 行为 进行 
相关 操作 , 因此 在 计算 机 上 的 相关 研究 无 法 直接 运用 
到 移动 设备 中 。 随 着 移动 设备 的 大 量 普及 , 学 者 将 注意 
力 转移 到 研究 移动 设备 中 的 用 户 手 势 行 为 中 。Guo 等 中 
比较 了 移动 设备 中 的 触摸 操作 和 计算 机 设备 中 使 用 鼠 
标 和 键盘 的 操作 之 间 的 不 同 , 通过 挖掘 移动 设备 的 用 
户 行为 提高 检索 结果 的 效果 。Han 等 中 利用 移动 手势 行 
为 发 现 与 用 户 关联 度 最 高 的 文本 片段 ,进而 提高 跨 设备 
检索 的 效果 。 文献 [8] 研 究 表明 在 用 户 浏览 一 篇 文章 的 过 


文 分 词 、 关 键 词 抽取 等 自然 语言 处 理 技 术 得 到 用 户 在 
阅读 时 的 兴趣 词 ; 根据 得 到 的 兴趣 词 刻画 用 户 兴趣 画 
像 并 使 用 数据 可 视 化 工具 展示 用 户 画 像 。 

(3) 视图 层 

视图 层 包 括 用 户 个 人 信息 的 管理 、 文 献 阅读 以 及 
用 户 兴趣 画像 的 可 视 化 展示 。 
3.3 ”关键 技术 描述 

(1) 文本 片段 兴趣 度 的 计算 

本 文通 过 分 析 用 户 浏 览 文献 过 程 中 的 手势 行为 与 
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z 为 0.2797, tap 的 权重 为 0.0936。 一 致 性 检验 结果 为 
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浏览 时 间 获 取 用 户 感 兴趣 的 文本 片段 ， 并 计算 文本 片 
段 的 兴趣 度 。 确 定 了 不 同 手势 行为 , 反映 用 户 对 文本 


表 2 手势 行为 权重 


手势 行为 ” pinch in/out drag tap swipe 


片段 感 兴趣 度 的 权重 大 小 。pinch in 手势 行为 表示 用 户 
在 缩小 屏幕 中 的 内 容 ; pinch out 表示 用 户 在 放大 屏幕 
中 的 内 容 ; drag 表示 用 户 手指 在 屏幕 上 缓慢 地 滑动 ; 
swipe 表示 用 户 手指 在 屏幕 上 快速 地 滑动 。 由 于 swipe 
手势 行为 表示 用 户 正 在 快速 地 更 换 屏 幕 中 显示 的 内 容 ， 
所 以 swipe 对 反映 文本 片段 兴趣 度 的 贡献 值 很 小 外, 据 
此 本 文 将 swipe 的 权重 设置 为 0。 对 pinch in/out, drag, 
tap 采用 层次 分 析 法 确定 各 自 的 权重 。 在 用 户 浏览 文章 
时 发 生 的 手势 行为 中 , pinch inout 操作 的 权重 最 高 ， 
其 次 是 drag 操作 ,而 tap 操作 的 权重 最 小 。 据 此 构建 
判断 矩阵 ， 如 表 1 所 示 。 

表 1 中 , 第 二 行 第 三 列 中 的 3 代表 pinch inout fT 
为 比 drag 行为 稍微 重要 /有 优势 , 第 二 行 第 四 列 中 的 5 


数据 分 析 与 知识 发 现 


权重 0.6267 0.2797 0.0936 0 


文献 由 不 同 的 文本 片段 组 成 , 用 户 在 不 同 的 文本 
片段 会 产生 不 同 的 浏览 时 间 。 本 文 利 用 文本 片段 上 发 
生 的 手势 行为 测量 用 户 在 该 文本 片段 的 浏览 时 间 。 即 
在 用 户 浏 览 文 献 时 ,系统 后 台 会 自动 记录 下 用 户 手势 
行为 第 一 次 作用 于 文本 片段 的 时 间 。 本 文 把 手势 行为 
第 一 次 作用 于 该 文本 片段 的 时 间 与 用 户 离开 该 文本 片 
段 后 手势 行为 第 一 次 作用 于 其 他 文本 片段 的 时 间 差 作 
为 该 文本 片段 的 浏览 时 间 。 计 算 文 本 片段 Pj; 的 浏览 时 
间 #4 如 公式 (1) 所 示 。 


td te 
二 = 太一 如 (1) 


L 


Hep, t/ 表示 文本 片段 已 第 一 次 发 生 手势 行为 的 


时 刻 ，1 表示 离开 文本 片段 P; 后 手势 行为 第 一 次 发 生 
在 其 他 文本 片段 上 的 时 刻 。 

用 户 在 文章 中 不 同文 本 片段 的 浏览 时 间 之 和 即 为 
用 户 浏览 该 文章 的 时 间 。 用 户 浏览 文章 的 时 间 7 的 计 
算 方法 如 公式 (2) 所 示 。 


T= (2) 


其 中 , # 表 示 文 本 片段 P; 的 浏览 时 间 , n 表示 文章 

中 发 生 手势 行为 的 文本 片段 个 数 。 
文本 片段 的 浏览 时 间 能 够 反映 出 用 户 对 文本 片段 
的 兴趣 度 ; 同时 , 发 生 在 文本 片段 上 的 手势 行为 同样 
能 够 反映 用 户 对 文本 片段 的 兴趣 度 。 本 文 结合 时 间 与 
手势 行为 信息 , 综合 计算 用 户 对 文本 片段 的 兴趣 度 。 
文本 片段 i 中 手势 行为 pinch in/out, drag, tap, swipe 
发 生 的 次 数 分 别 为 万 fas fis fo 对 应 的 权重 分 别 为 vp. 
Vas Vi, Vo 文本 片段 Pi 的 浏览 时 间 为 文本 片段 所 属 
文章 的 总 浏览 时 间 为 7。 设 文本 片段 P, 对 应 的 权重 为 
Wi), 则 文本 片段 已 的 兴趣 度 计算 方式 如 公式 (3) 所 示 。 


WO= (f, xv, * f, xv e f xy tf xv) Q) 


(2) 文本 片段 的 关键 词 抽 取 及 向 量 空间 表示 

本 文采 用 ICTCLAS 进行 文本 片段 关键 词 的 抽 
取 。ICTCLAS 是 一 款 处 理 中 文 文本 的 程序 包 , 它 可 以 
完成 文本 分 词 、 计 算 关 键 词 、 发 现 新 闻 等 文本 处 理 任 
4. ICTCLAS 3T fri E E E EROE rn Boe in] s 
提取 出 关键 词 后 保留 关键 词 的 权重 并 将 权重 归 一 化 处 
HE, 处 理 过程 如 公式 (4) 所 示 。 


NC, = = min ( 4) 


max min 


其 中 , C; 表 示 文 本 中 利用 ICTCLAS 处 理 后 某 个 词 
的 关键 词 权 重 ，Caax 是 文本 中 全 部 关键 词 权重 的 最 大 
(E, Cmn 是 文本 中 全 部 关键 词 权 重 的 最 小 值 ，NC; 为 归 
一 化 处 理 后 关键 词 的 权重 。 

综 上 , 笔者 对 发 生 手 势 行为 的 文本 片段 抽取 关键 
词 之 后 , 得 到 一 组 用 来 表示 该 文本 片段 的 关键 词 序列 
以 及 与 关键 词 对 应 的 权重 。 通 过 使 用 向 量 空间 模型 来 
表达 该 文本 片段 , 文本 片段 P; 表 达 方 式 如 下 所 示 : 

P={(Ki, NO), (Ko, NC?) * (Kns NC) 


CDhttp://ictclas.nlpir.org/. 
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其 中 , K 表示 Pi 段 中 抽取 的 第 

(3) 用 户 画 像 生 成 及 可 视 化 

在 完成 手势 行为 与 浏览 时 间 信 息 得 到 文本 片段 兴 
趣 度 和 利用 关键 词 抽取 技术 获得 文本 片段 关键 词 之 
后 , 计算 用 户 的 兴趣 关键 词 , 构建 用 户 的 兴趣 空间 ,由 
于 用 户 在 浏览 特定 文献 时 ,并 不 是 对 文献 中 的 所 有 内 
容 都 感 兴趣 ， 而 是 关注 于 文献 中 的 某 几 个 文本 片段 。 
把 发 生 手势 行为 的 文本 片段 提取 出 来 , 重新 组 成 用 户 
浏览 的 文献 D, BP: 

DA(Pi, P» *…, P4) 
P 表示 文献 D; 中 发 生 了 手势 行为 的 文本 片段 。 
经 获得 文本 片段 Pi; 的 兴趣 度 Wi) 与 关键 词 权 重 
NC ， 0.5。 根 据 文本 片段 兴趣 
度 计算 P; 中 关键 词 K 的 兴趣 度 。 计 算 方 法 如 公式 (5) 
所 示 。 
KREN] K 2538€ -0.5xNC340.5 xW(i) (5) 

其 中 ,表示 文本 片段 P; 中 抽取 的 关键 词 。 
通过 上 述 步 又 ,获得 文章 Di; 中 每 一 个 发 生 手 势 行 
为 的 文本 片段 中 的 关键 词 兴趣 度 。 在 得 到 文本 片段 中 
关键 词 兴趣 度 之 后 ,进一步 计算 用 户 在 文章 D; 中 最 感 
兴趣 的 关键 词 。 如 果 关 键 词 在 不 同 发 生 手 势 行为 的 文 
本 片段 中 出 现 , 计算 其 平均 兴趣 度 ， 以 此 作为 用 户 在 
浏览 文章 D; 时 对 该 关键 词 的 兴趣 度 。 计算 方法 如 公式 
(6) 所 示 。 


个 关键 词 。 


> Pa) 
KI E — (6) 
其 中 ,P(NO) 表 示 关键 词 在 文本 片段 P 中 的 兴 
度 ,为 文章 D; 中 包含 某 一 个 关键 词 的 个 数 。 分 子 表示 
关键 词 在 不 同文 本 片段 中 的 兴趣 度 之 和 。 
综 上 即 得 到 文章 D, 用 户 感 兴趣 的 关键 词 以 及 对 
应 的 兴趣 度 , 选择 兴趣 度 最 大 的 10 个 关键 词 用 来 表示 
RU (e cte ei. MUT 
样 的 方法 计算 用 户 浏览 的 所 有 文章 ,每 一 篇 文章 都 包 
含 用 户 兴趣 度 最 高 的 10 个 关键 词 . 最终 将 处 理 后 的 文 
章 组 成 用 户 浏览 的 文章 集合 DAD, D, Dy). EX 
章 集合 D 中 ,分 别 计算 每 一 个 关键 词 在 文档 集合 中 出 
现 的 频率 , 进而 得 到 用 户 的 兴趣 空间 。 用 户 的 兴趣 画 
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像 表 示 为 如 下 集合 : 
Wa, mı), (Ko, m»), ***, (ki, 72 

其 中 , m; 表 示 关 键 词 出 现 的 频率 , i91, 2，…, no 

在 得 到 用 户 画 像 后 , 笔者 使 用 数据 可 视 化 工具 更 
加 清晰 地 展示 用 户 画 像 。 本 文采 用 百度 公司 提供 的 可 
视 化 工具 ECharts "实现 用 户 画 像 的 可 视 化 工作 。 通 过 
使 用 ECharts 中 的 字符 云图 展示 用 户 画 像 ， 其 中 用 户 
画像 中 的 关键 词 表 示 字 符 云 图 上 的 字符 , 对 应 的 频率 
作为 字符 的 权重 用 来 控制 字符 的 字体 大 小 。 


4 系统 开发 与 应 用 


4.1 系统 开发 

为 了 收集 用 户 在 浏览 过 程 中 的 手势 行为 , 开发 了 
手机 阅读 网 站 一 一 文献 阅读 系统 ,其 界面 如 图 3 所 示 。 
用 户 通过 注册 文献 阅读 系统 , 便 可 以 使 用 相应 的 账号 
登录 系统 并 阅读 相关 文献 , 在 阅读 过 程 中 , 用 户 可 以 
进行 评论 、 转 发 、 点 赞 等 行为 ， 而 本 文 主要 研究 通过 
用 户 在 浏览 页 面 过 程 中 发 生 的 手势 行为 信息 结合 浏览 
时 间 来 挖掘 用 户 感 兴趣 的 领域 。 


localhosteOBO/NewsWeb/ru M coccc | 欢迎 使 用 文献 阅读 系统 
| 


欢迎 使 用 文献 阅读 系统 


欢迎 登录 文献 阅读 系统 


个 人 信息 管理 工具 使 用 意 尼 研 究 -一 以 名 能手 机 为 例 O tT 
BEGAMPRENSDEESERXSE 1.0 
Li 情报 字 杭 角 的 政府 信息 公开 一 面向 使 用 的 政府 信 ..… @ BRF 


| I 公 
| “ 曙 书 忆 大 数据 体系 构建 的 学 术 环境 和 总 咯 思考。 0 息 化 部 ( MIIT ) 公布 的 数据 显 


大 数据 知识 服务 的 内 通 、 典 型 特征 及 鬼 信 机 型 ë 8| 总 
| annssnnamsnenam el B E 
| 大 数据 知识 服务 平台 构 于 关 错 技术 研究 e| 
注册 账号 社会 网 结 环境 下 的 信息 推荐 研究 过 评 e| 
信息 伦理 和 版 权 制度 的 基本 问题 : XE, ARR. @ 
| Ereserves VR RI e| 
学 术 期 刊 评价 理论 的 演变 分 析 LJ 
| 
EP 


| 社会 角色 视角 下 网 络 社区 用 户 关 型 及 其 关系 的 a 别 才 i 
CE 
(a) 登录 页 面 (b) 标题 页 面 


图 3 系统 展示 


系统 可 以 识别 用 户 在 浏览 页 面 过 程 中 发 生 的 放大 
(pinch outb)/ 缩 小 (pinch in)、 滑 动 (swipe)、 拖 动 (drag)、 
点 击 (tap) 手 势 行为 ,并 记录 手势 行为 对 应 的 文本 片段 
文本 及 文本 片段 浏览 时 间 。 本 文采 用 JavaScript 开源 
工具 包 * 识 别 用 户 的 手势 行为 ,在 设计 收集 手势 行为 对 
应 的 文本 片段 时 参考 了 Han 的 相关 js 代码 。 

系统 设计 完毕 后 , 用 户 可 以 注册 、 登 录 系 统 , 然后 


(c) 内 容 页 面 


CDhttp://echarts.baidu.com.cn/. : 
Qhttp://hammerjs.github.io/. 
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根据 自身 的 兴趣 爱好 和 研究 领域 阅读 相关 文献 。 
4.0 系统 应 用 

为 检测 该 系统 的 可 行 性 ,招募 研究 组 中 的 一 个 研 
究 生 进行 相关 实验 。 实 验 之 前 , 介绍 了 系统 基本 情况 
及 系统 的 使 用 方法 ; 被 试 人 员 根 据 自 己 的 兴趣 爱好 浏 
览 系统 的 相关 文献 。 

系统 将 前 台 收 集 到 的 用 户 手势 数据 、 对 应 的 文本 
片段 文本 以 及 其 他 相关 数据 存 人 数据 库 中 , 数据库 中 
的 信息 包括 用 户 ID(userID)、 阅 读 的 文章 ID 
(documentID)、 手 势 行为 发 生 的 时 间 (time) 发 生 在 文本 
片段 文本 上 的 手势 行为 (type)、 文 本 片段 文本 
(touchHtmD) 以 及 手势 行为 的 详细 数据 (手势 行为 发 生 
的 位 置 .手势 行为 的 速度 .时 间 玲 等 )。 用 户 ID 为 userl 
浏览 第 32 篇 文章 的 手势 行为 序列 如 表 3 所 示 ( 文 本 片 
段 数据 较 多 ,省 略 显示 )。 
3 手势 行为 序列 


€ 
userID  documentID time type touchHtml 
userl 32 2016-01-10 13: 47: 01 drag paragraphl 
userl 32 2016-01-10 13: 47: 02 drag paragraphl 
userl 32 2016-01-10 13: 47: 13 drag paragraph2 
userl 32 2016-01-10 13: 47: 14 drag paragraph2 
userl 32 2016-01-10 13: 47: 19 drag paragraph3 
userl 32 2016-01-10 13: 47: 20 drag paragraph3 
userl 32 2016-01-10 13: 47: 25 drag paragraph3 
userl 32 2016-01-10 13: 47: 55. tap  paragraph4 
userl 32 2016-01-10 13: 48: 17 drag paragraph5 
userl 32 2016-01-10 13: 48: 18 drag paragraph5 
userl 32 2016-01-10 13: 48: 19 drag paragraph5 
userl 32 2016-01-10 13: 48: 20 drag paragraph5 
userl 32 2016-01-10 13: 48: 39. drag paragraph6 
userl 32 2016-01-10 13: 48: 40 drag paragraph6 
userl 32 2016-01-10 13: 48: 41 drag paragraph6 
userl 32 2016-01-10 13: 48: 42. drag paragraph6 
userl 32 2016-01-10 13: 48: 43 drag paragraph6 
userl 32 2016-01-10 13: 48: 45 drag paragraph6 


QÈ: paragraph 后 的 数字 i 并 不 代表 属于 文章 中 的 第 i 段 , 而 只 
是 为 了 区 别 不 同 的 文本 片段 。) 
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在 剔除 无 效 数 据 之 后 ,经 过 处 理 获 得 用 户 在 阅读 
一 篇 文章 时 的 手势 行为 序列 与 对 应 的 文本 片段 文本 的 
时 间 信 息 。 

采取 上 文 计 算 文本 片段 的 浏览 时 间 的 方法 得 到 文本 
片段 的 浏览 时 间 , 其 次 计算 文 片段 上 发 生 手势 行为 的 种 
类 与 对 应 的 次 数 , readtime 表示 该 文本 片段 阅读 的 时 间 ， 
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dragtime 表示 drag 操作 在 该 文本 片段 中 发 生 的 次 数 ， 
swipetime 表示 swipe 操作 在 该 文本 片段 发 生 的 次 数 ， 
taptime 表示 tap 操作 发 生 的 次 数 , pinchintime 表示 pinch 
in 操作 发 生 的 次 数 , pinchouttime 表示 pinch out 操作 发 
生 的 次 数 , 得 到 的 结果 如 表 4 所 示 。 最 终 得 到 user 在 浏 
览 文章 D; 过 程 中 感 兴 趣 的 关键 词 以 及 对 应 的 兴趣 度 。 


userID documentID readtime dragtime swipetime taptime pinchintime pinchouttime touchHtml 
userl 32 0 分 12 秒 1 0 0 0 0 paragraphl 
userl 32 04r 6 f 2 0 0 0 0 paragraph2 
userl 32 0 4) 36 f 2 0 0 0 0 paragraph3 
userl 32 0 4) 22 fh 0 0 1 0 0 paragraph4 
userl 32 0 4) 22 fh 2 0 0 0 0 paragraph5 
userl 32 04r 6 fh 4 0 0 0 0 paragraph6 


使 用 同样 方法 处 理 userl 阅读 的 其 他 文章 , 形成 
用 户 浏览 的 文章 集合 。 根 据 文章 集合 得 到 的 用 户 兴 
空间 如 下 : 

Jiserl={( 政 府 知识 管理 ，2), (个 人 信息 管理 ，2), (社会 化 ， 
1), (UTAUT, 1), (系统 , 1), (信任 , D), (信任 信念 , 1), (政府 , 1), 
(专利 审核 , D, (模型 , 1), (问题 , 1), (信息 , D, (智能 手机 , 1), 
(问题 解决 , 1), (个 人 信息 , 1), (感知 有 用 性 , 2), (社会 化 媒体 ， 
1), (技术 采纳 , 1), ( 微 博 , 2), (社会 化 媒体 应 用 , 3)} 

采用 ECharts 处 理 上 述 的 用 户 兴趣 空间 。 云 图 中 ， 
用 户 对 某 一 个 关键 词 的 兴趣 越 大 , 该 关键 词 的 字体 越 
大 。 结 果 如 图 6 所 示 。 


本 文 结合 Java Web 相关 技术 构建 了 移动 阅读 系 
统 。 该 系统 可 以 捕捉 用 户 在 阅读 时 发 生 的 手势 行为 。 
用 户 注册 以 后 ， 即 可 通过 移动 设备 登录 系统 并 在 系统 
上 阅读 自己 感 兴趣 的 文献 。 在 用 户 阅读 过 程 中 , 系统 
会 自动 记录 下 用 户 在 阅读 时 发 生 的 手势 行为 、 手 势 行 
为 发 生 的 时 间 以 及 发 生 手势 行为 的 文本 片段 并 将 数据 
存 人 服务 器 中 。 在 获得 用 户 相关 的 手势 行为 数据 后 ， 


系统 使 用 自然 语言 处 理 技术 构建 用 户 兴 趣 画 像 ， 并 最 
终 使 用 可 视 化 技术 展示 用 户 兴 趣 画 像 。 

本 文 没有 比较 利用 移动 设备 中 的 用 户 手 势 行 为 建 
模 与 使 用 传统 方式 建 模 之 间 的 差异 , 在 今后 的 工作 中 
将 进行 相关 实验 。 用 户 在 浏览 文章 过 程 中 , 除了 发 生 
手势 行为 ,还 会 发 生 其 他 行为 ， 如 对 一 篇 文章 点 赞 、 转 
发 文章 、 评 论文 章 等 。 本 文 在 建立 用 户 兴趣 空间 时 没 
有 加 入 点 赞 、 转 发 、 评 论 等 影响 因素 , 在 今后 的 工作 
中 , 将 结合 这 些 因素 更 加 深入 地 研究 用 户 兴趣 爱好 。 
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Constructing Users Profiles with Content and Gesture Behaviors 
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Abstract: [Objective] This paper constructs users profiles by gauging their interests from gesture behaviors and related 


contents from a mobile article reading system. [Context] Users profiles construction with content and gesture behaviors 


can identifies users' mobile reading interests and profiles effectively. [Methods] First, we collected user gesture 


behaviors (such as tap, double tap, swipe, drag, pinch in/out) as well as corresponding contents from a mobile article 


reading system. Second, we established the users model based on the collected data and reading time. [Results] Users 


could find their own reading interests while browsing papers with our system, which help us build users profiles. 


[Conclusions] Users gesture behaviors reveal their reading interests, which could improve the performance of 


marketing and personalized recommendation systems. 
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